Скрыть
Раскрыть

ISSN 1998-0663 (print),
ISSN 2587-8166 (online)

English version: ISSN 2587-814X (print),
ISSN 2587-8158 (online)

Жукова Г. Н.1, Ульянов М. В.2,3
  • 1 НИУ ВШЭ, 101000, Россия, Москва, ул. Мясницкая, д.20
  • 2 Московский государственный университет им. М.В. Ломоносова , 119991, г. Москва, Ленинские горы, д. 1
  • 3 Институт проблем управления им. В.А. Трапезникова Российской академии наук, 117997, г. Москва, ул. Профсоюзная, д. 65

К вопросу о восстановлении символьных последовательностей, кодирующих зашумленные периодические функции

2021. № 4 Vol.15. С. 22–35 [содержание номера]
В бизнес-информатике, одним из предметов исследования которой является анализ данных о процессах в прикладных предметных областях, возникают задачи качественного анализа. Такого рода задачи возникают, например, при качественном исследовании лог-файлов бизнес-процессов, при анализе и прогнозировании временных рядов, и других процессов различной природы. Достаточно часто для представления информации об исследуемых процессах в методах качественного анализа используется символьное кодирование, позволяющее снять излишнюю детализацию числовых описаний. Актуальность данного исследования связана с тем, что при работе с исходными данными исследователи зачастую сталкиваются с наличием шумов и искажений в исходных данных, что существенно затрудняет решение задач качественного анализа. При работе с символьными представлениями исследуемых процессов, которые достаточно часто имеют периодический характер, мы наблюдаем шумы удаления, вставки и замены символов, усложняющих решение задачи определения и анализа периодичности. В статье рассматривается задача восстановления периодических символьных последовательностей, полученных кодированием по отсчетам периодических функций и искаженных шумами вставки, замены и удаления символов. В качестве конкретного примера синтетических данных временных рядов рассматриваются тригонометрические функции. Для кодирования тригонометрических функций используются алфавиты различных мощностей с различной детализацией интервалов отсчетов по модельному времени. В статье представлено экспериментальное исследование зависимости характеристик качества метода восстановления периода и периодически повторяющегося фрагмента, ранее предложенного авторами и усовершенствованного в данном исследовании. Для алфавитов разной мощности при фиксированных интервалах отсчетов по модельному времени приводятся доля последовательностей с удовлетворительно восстановленным периодом и относительная погрешность определения длины периода. Качество восстановления периодически повторяющегося фрагмента оценивается отношением редакционного расстояния от восстановленной периодической последовательности до исходной последовательности, искаженной шумами.

Библиографическое описание: Жукова Г.Н., Ульянов М.В. К вопросу о восстановлении символьных последовательностей, кодирующих зашумленные периодические функции // Бизнес-информатика. 2021. Т. 15. № 4. С. 22–35. DOI: 10.17323/2587-814X.2021.4.22.35
BiBTeX
RIS
 
 
Rambler's Top100 rss